在基于文本的分类器中测试公平性问题的一种常见方法是通过使用反事实来:如果更改输入中的敏感属性,则分类器输出是否会更改?现有的反事实生成方法通常依赖于单词列表或模板,产生不考虑语法,上下文或微妙敏感属性引用的简单反事实,并且可能会错过WordList创建者未考虑的问题。在本文中,我们介绍了一项为克服这些缺点而产生的反事实的任务,并证明了如何利用大型语言模型(LLM)来在此任务上取得进展。我们表明,这种基于LLM的方法可以产生现有方法无法实现的复杂反事实,从而比较了民事评论数据集中各种反事实生成方法的性能,并在评估毒性分类器时显示出它们的价值。
translated by 谷歌翻译
我们提出了一种模块化架构,用于终身学习的分层结构化任务。具体而言,我们证明我们的架构是理论上能够学习通过可被学习的函数来解决的任务,这些任务可以给予用于其他,先前学习的任务作为子例程的函数。我们经验证明,我们可以通过标准培训方法在实践中学习的一些任务;实际上,事先工作表明,在没有更简单的任务的帮助下,无法通过任何有效的方法学习一些这样的任务。我们还考虑自动识别任务的方法,而无需依赖明确给出指标。
translated by 谷歌翻译
湍流无处不在,获得有效,准确且可概括的订单模型仍然是一个具有挑战性的问题。该手稿开发了减少拉格朗日模型的湍流模型的层次结构,以研究和比较在拉格朗日框架内实施平滑的粒子流体动力学(SPH)结构与嵌入神经网络(NN)作为通用函数近似器中的效果。 SPH是用于近似流体力学方程的无网格拉格朗日方法。从基于神经网络(NN)的拉格朗日加速运算符的参数化开始,该层次结构逐渐结合了一个弱化和参数化的SPH框架,该框架可以执行物理对称性和保护定律。开发了两个新的参数化平滑核,其中包含在完全参数化的SPH模拟器中,并与立方和四分之一的平滑核进行了比较。对于每个模型,我们使用基于梯度的优化最小化的不同损耗函数,其中使用自动分化(AD)和灵敏度分析(SA)获得了有效的梯度计算。每个模型均经过两个地面真理(GT)数据集训练,该数据集与每周可压缩的均质各向同性湍流(hit),(1)使用弱压缩SPH的验证集,(2)来自直接数值模拟(DNS)的高忠诚度集。数值证据表明:(a)对“合成” SPH数据的方法验证; (b)嵌入在SPH框架中近似状态方程的NN的能力; (b)每个模型都能插入DNS数据; (c)编码更多的SPH结构可提高对不同湍流的马赫数和时间尺度的普遍性; (d)引入两个新型参数化平滑核可提高SPH比标准平滑核的准确性。
translated by 谷歌翻译